Pengantar Pemodelan Generatif: Melampaui Diskriminasi
Kita sedang beralih dari pemodelan diskriminatif, yang menyelesaikan tugas klasifikasi dan regresi dengan mempelajari probabilitas bersyarat $P(y|x)$, menuju bidang yang lebih kompleks yaitu pemodelan generatif. Tujuan utama kita kini berubah menjadi estimasi densitas: mempelajari distribusi data dasar yang lengkap, yaitu $P(x)$ itu sendiri. Perubahan mendasar ini memungkinkan kita menangkap ketergantungan yang rumit dan struktur kompleks dalam dataset berdimensi tinggi, melampaui pemisahan batas semata hingga mencapai pemahaman dan sintesis data yang sejati.
1. Tujuan Generatif: Memodelkan $P(x)$
Tujuan dari model generatif adalah untuk memperkirakan distribusi probabilitas $P(x)$ dari mana data pelatihan $X$ berasal. Model generatif yang sukses dapat melakukan tiga tugas penting: (1) Estimasi Densitas (memberikan skor probabilitas pada input $x$), (2) Pengambilan Sampel (menghasilkan titik data baru sepenuhnya $x_{new} \sim P(x)$), dan (3) Pembelajaran Fitur Tak Berlabel (menemukan representasi yang bermakna dan terpisah dalam ruang laten).
2. Taksonomi: Likelihood Eksplisit vs. Implisit
Model generatif pada dasarnya dikategorikan berdasarkan pendekatannya terhadap fungsi likelihood. Model Densitas Eksplisit, seperti Autoencoder Variasional (VAEs) dan Model Aliran, mendefinisikan fungsi likelihood matematis dan berusaha memaksimalkannya (atau batas bawahnya). Model Densitas Implisit, yang paling terkenal adalah Jaringan Adversarial Generatif (GANs), menghindari perhitungan likelihood sama sekali, melainkan mempelajari fungsi pemetaan untuk mengambil sampel dari distribusi $P(x)$ menggunakan kerangka pelatihan adversarial.
Goal: Determine if $x_{new}$ is an anomaly (fraud).
The model must evaluate the probability (or likelihood) $P(x_{new})$. If $P(x_{new})$ falls below a predefined threshold $\tau$, meaning the new point is statistically improbable under the learned distribution of normal transactions, it is flagged as an anomaly.